جستجوی کلمات کلیدی در رشته ی گفتار
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق
- نویسنده هادی نادری
- استاد راهنما حسین مروی
- سال انتشار 1391
چکیده
تشخیص کلمات کلیدی یا keyword-spotting در حالت کلی به معنای یافتن یک کلمهی کلیدی در یک پروندهی نوشتاری و یا گفتاری است. در این تحقیق، یک روش جدید تشخیص یا بازشناسی کلمات کلیدی در زبان فارسی، در دوحالت پیوسته و گسسته معرفی شده است. در هر دوحالت تشخیص کلمات کلیدی در گفتار پیوسته و گسسته، از روش dynamic time warping(dtw) استفاده شده است که با سیستمهایی که بر اساس مدل مخفی مارکوف طراحی شده و امروزه به طور گسترده از آنها استفاده میشود، متفاوت هستند. روش ارائه شده برای تشخیص کلمات کلیدی در حالت پیوسته، بر پایهی حالت اصلاح شدهای از روش قدیمی dynamic time warping است، که یک روش ابتدایی برای محاسبهی میزان شباهت دو دنبالهی متغیر با زمان است. در مرحلهی پردازش، سیگنال گفتار به فریمهایی با طول کم تقسیم میشود. هر فریم به صورت یک بردار کوانتیزه شده از ویژگیها نمایش داده میشود. هم کلمهی کلیدی و هم گفتار اصلی که جستجو در آن انجام میشود، به صورت دنبالهای یک بعدی از اندیسهای کتاب کد تبدیل میشوند. سپس دنبالهی اندیسهای گفتار اصلی به چندین جزء تقسیم شده و فاصلهی هرکدام از این بخشها طبق معیار dtw با اندیسهای کلمهی کلیدی بدست میآید. برای هر بخش یک امتیاز اعوجاج محاسبه میشود و بخشی که کمترین امتیاز اعوجاج را داشته باشد، به عنوان محل احتمالی حضور کلمهی کلیدی معرفی میشود. در روش ارائه شده برای تشخیص کلمات کلیدی در حالت گسسته نیز از روش dtw استفاده شده است. در این حالت، ابتدا از نمونههای مختلف از یک کلمهی کلیدی خاص که توسط یک یا چند گوینده بیان شدهاند و دارای طول متفاوت هستند، بردارهای ویژگی را استخراج کرده و سپس کلمهای که دارای کوچکترین طول است را به عنوان نمونهی مرجع انتخاب میکنیم. سپس با استفاده از روش dtw، مسیر همترازی نمونهی مرجع و سایر نمونهها را بدست آورده و از روی مسیر همترازی، ابعاد ماتریس ویژگی سایر نمونهها را هم بعد با نمونهی مرجع میسازیم. در نهایت از ماتریس ویژگی تمام نمونهها، میانگین میگیریم تا یک نمونهی مرجع عام برای هر کلمهی کلیدی بدست آید. در ادامه از این نمونهی مرجع عام در فرایند تشخیص استفاده میکنیم.
منابع مشابه
ارائه روشی برای استخراج کلمات کلیدی و وزندهی کلمات برای بهبود طبقهبندی متون فارسی
Due to ever-increasing information expansion and existing huge amount of unstructured documents, usage of keywords plays a very important role in information retrieval. Because of a manually-extraction of keywords faces various challenges, their automated extraction seems inevitable. In this research, it has been tried to use a thesaurus, (a structured word-net) to automatically extract them. A...
متن کاملانتخاب بهینه ی کلمات کلیدی برای موتور های جستجو
به طور کلی، روش های ارائه شده جهت استخراج خودکار کلمات کلیدی، سعی در بدست آوردن نتایج بهتر در معیارهایی مانند بازخوانی و دقت دارند. اگرچه این معیارها، میزان کارایی روش استخراج کلمات کلیدی در نقش یک انسان را نشان می دهد اما با توجه به نقش غیرقابل انکار موتورهای جستجو در دنیای امروز، به نظر می رسد که در انتخاب کلمات کلیدی علاوه بر توجه به معیارهای رایج بازیابی اطلاعات باید به افزایش میزان دسترسی ...
15 صفحه اولارزیابی تراکم کلمات کلیدی در وب سایت های برتر کتابخانه مرکزی دانشگاه های علوم پزشکی ایران
امروزه وب، اصلیترین ابزار دسترسی و اشاعه اطلاعات به شمار میرود، به گونهای که کتابخانهها و مراکز اطلاعرسانی، بسیاری از خدمات خود را از طریق وب به کاربران ارائه میدهند. بررسیها حاکی از آن است که توانایی وبسایتها در تبلیغ و بازاریابی خدمات کتابخانهها و مراکز اطلاعرسانی به اثبات رسیده است. از دلایل اصلی موفقیت در بازاریابی، امکان بازیابی سریع و دقیق اطلاعات از وبسایت کتابخانهها ...
متن کاملارائه روشی جدید برای شاخصگذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشهبندی متون
Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...
متن کاملمقایسه ی درک نوای غیرعاطفی (زبانی) گفتار در دو جنس
توانایی های گفتاری مردان با زنان متفاوت است. هدف از این مطالعه، بررسی تفاوت دو جنس در درک نوای غیر عاطفی (زبانی) گفتار است. این مطالعه به صورت مقطعی- مقایسه ای بر روی 50 نفر در دو گروه مرد و زن صورت گرفت. پاسخ هر یک از گروه های مورد بررسی به مجموعه آزمون های تهیه شده ثبت شد. محرک های مورد استفاده در این پژوهش، جملات غیرعاطفی (سوالی، امری و خبری) بودند که به صورت معنی دار، بی معنی و فیلتر شده در...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023